Không chắc chắn là gì? Các nghiên cứu khoa học về Không chắc chắn
Không chắc chắn là trạng thái thiếu hoặc không đầy đủ thông tin khiến kết quả hay hiện tượng không thể dự đoán chính xác tuyệt đối trong khoa học và đời sống. Đây không đồng nghĩa với sai số mà là thước đo mức độ tin cậy, được mô tả bằng khoảng giá trị, xác suất hoặc mức phủ trong nhiều lĩnh vực nghiên cứu.
Khái niệm không chắc chắn
Không chắc chắn (uncertainty) là trạng thái thông tin về một đại lượng, hiện tượng hoặc kết quả còn thiếu, nhiễu hoặc không đầy đủ, khiến ta không thể dự đoán chính xác duy nhất giá trị hoặc diễn biến tương lai. Trong khoa học đo lường, không chắc chắn được xem là thuộc tính gắn liền với mọi phép đo và phải được định lượng cùng với kết quả. Theo NIST, độ không chắc chắn là “một tham số gắn với kết quả đo, mô tả phạm vi giá trị mà đại lượng đo thực sự có thể nằm trong đó”.
Không chắc chắn khác với sai số ở chỗ sai số ám chỉ độ lệch so với giá trị đúng (thường không biết), còn không chắc chắn mô tả mức độ tin cậy đối với kết quả. Trong thực hành, kết quả khoa học nên được báo cáo kèm dải hoặc khoảng tin cậy, ví dụ , trong đó là độ không chắc chắn mở rộng tương ứng với một mức phủ định trước (coverage). Hướng dẫn GUM của ISO/IEC Guide 98-3 nhấn mạnh yêu cầu minh bạch nguồn gốc không chắc chắn để quyết định dựa trên bằng chứng có thể kiểm chứng.
Bối cảnh ứng dụng của không chắc chắn trải rộng từ vật lý thực nghiệm, kỹ thuật, y sinh học, khoa học khí hậu đến kinh tế – tài chính. Những quyết định tối ưu trong điều kiện không chắc chắn cần đồng thời cân nhắc chi phí thông tin, mức rủi ro chấp nhận, và hệ quả sai lầm, do đó việc định lượng và truyền thông không chắc chắn là phần không thể tách rời của quản trị rủi ro.
Phân loại không chắc chắn
Phân loại theo nguồn gốc thường dùng cặp đối lập: aleatory (ngẫu nhiên, nội tại) và epistemic (do thiếu hiểu biết, có thể giảm bằng thông tin). Không chắc chắn aleatory phản ánh biến thiên vốn có của hệ thống (ví dụ dao động kích thước hạt trong cùng điều kiện), còn epistemic do mô hình chưa đầy đủ, dữ liệu ít, hoặc hiệu chuẩn dụng cụ hạn chế. Một cách nhìn khác chia thành cấu trúc mô hình (thiếu sót trong phương trình/giả định) và tham số (không biết chính xác giá trị tham số).
Bảng đối chiếu đặc trưng và hệ quả xử lý:
Loại không chắc chắn | Nguồn gốc điển hình | Khả năng giảm | Công cụ xử lý |
---|---|---|---|
Aleatory (ngẫu nhiên) | Biến thiên nội tại, nhiễu đo lường độc lập | Không thể loại bỏ, chỉ mô tả | Phân phối xác suất, mô phỏng Monte Carlo |
Epistemic (thiếu hiểu biết) | Thiếu dữ liệu, mô hình thiếu, hiệu chuẩn kém | Có thể giảm bằng thu thập/hiệu chuẩn | Khoảng giá trị, Bayesian, phân tích độ nhạy |
Cấu trúc mô hình | Đơn giản hóa, giả định sai | Giảm bằng cải tiến mô hình | So sánh mô hình, ensemble, học máy |
Tham số | Ước lượng tham số từ mẫu hữu hạn | Giảm bằng tăng kích thước mẫu | Ước lượng khoảng, kiểm định, Bayes |
Phân loại theo phép đo: type A (suy ra từ thống kê lặp đo) và type B (đánh giá từ thông tin sẵn có: chứng chỉ hiệu chuẩn, kinh nghiệm, quy chuẩn). Kết hợp hai loại này là chuẩn mực trong báo cáo đo lường theo GUM; xem thêm hướng dẫn tại NIST guidelines.
Không chắc chắn trong khoa học và đo lường
Độ không chắc chắn đo lường được xây dựng từ mô hình đo với là đại lượng đầu vào có không chắc chắn. Độ không chắc chắn chuẩn kết hợp thu được bằng khai triển tuyến tính và quy tắc truyền sai số:
Độ không chắc chắn mở rộng dùng hệ số phủ (thường gần cho mức phủ xấp xỉ 95%) theo ISO/IEC Guide 98-3 (GUM). Báo cáo kết quả đo cần nêu rõ mô hình đo, nguồn thành phần và giả định phụ thuộc để người đọc có thể đánh giá tính hợp lệ và tái lập.
Các nguồn thành phần phổ biến và cách phân loại:
- Dụng cụ: độ phân giải, tuyến tính, trễ; thường type B dựa trên chứng chỉ hiệu chuẩn.
- Lặp đo/điều kiện: lặp lại trong cùng điều kiện; type A từ độ lệch chuẩn mẫu.
- Môi trường: nhiệt độ, độ ẩm, rung; type B hoặc type A tùy kiểm soát.
- Lấy mẫu/chuẩn bị mẫu: không đồng nhất, sai lệch chọn mẫu.
Bảng ví dụ định lượng thành phần:
Thành phần | Loại | Phân phối giả định | Độ không chắc chắn chuẩn |
---|---|---|---|
Độ phân giải thiết bị | Type B | Đều trên ±a | |
Lặp đo (n lần) | Type A | Gần chuẩn | |
Bù nhiệt độ | Type B | Tam giác |
Không chắc chắn trong thống kê và xác suất
Không chắc chắn được mô tả bằng biến ngẫu nhiên với phân phối xác suất . Mức phân tán đo bằng phương sai và độ lệch chuẩn . Với mẫu độc lập có trung bình mẫu và độ lệch chuẩn mẫu , sai số chuẩn của trung bình là .
Khoảng tin cậy cho trung bình khi phân phối gần chuẩn hoặc cỡ mẫu đủ lớn: với là bách phân vị của phân phối Student. Trong khuôn khổ Bayes, không chắc chắn được mã hóa qua phân bố hậu nghiệm và tóm tắt bằng khoảng tin cậy Bayes (credible interval). Khi mô hình phức tạp, mô phỏng Monte Carlo và bootstrap được dùng để xấp xỉ phân phối của ước lượng.
Các công cụ thường dùng để định lượng và quản lý không chắc chắn thống kê:
- Phân tích độ nhạy: đánh giá đóng góp của biến đầu vào tới phương sai của đầu ra.
- Regularization và lựa chọn mô hình: giảm không chắc chắn do quá khớp.
- Ensemble/committee của mô hình: kết hợp dự báo để thu hẹp dải bất định.
- Hiệu chỉnh xác suất (calibration): đồng bộ xác suất dự báo với tần suất thực nghiệm.
Không chắc chắn trong khoa học khí hậu
Trong nghiên cứu khí hậu, không chắc chắn là yếu tố trung tâm trong việc xây dựng kịch bản và dự báo. Các nguồn chính của không chắc chắn bao gồm: (1) không chắc chắn kịch bản – liên quan đến giả định về phát thải khí nhà kính, phát triển kinh tế – xã hội; (2) không chắc chắn mô hình – do giới hạn của mô hình toán học và công cụ mô phỏng; (3) biến thiên nội tại – dao động tự nhiên vốn có của hệ thống khí hậu, ví dụ El Niño – La Niña. Báo cáo của IPCC thường nhấn mạnh cần kết hợp cả ba nguồn để cung cấp dải giá trị thay vì một con số duy nhất.
Các mô hình khí hậu toàn cầu (GCMs) được xây dựng dựa trên phương trình động lực học chất lưu và cân bằng năng lượng, nhưng vẫn cần giả định đơn giản hóa. Vì vậy, cộng đồng khoa học áp dụng cách tiếp cận ensemble, nghĩa là chạy nhiều mô hình và nhiều kịch bản để tạo ra dải dự báo. Ví dụ, dự báo tăng nhiệt độ toàn cầu cuối thế kỷ 21 theo kịch bản phát thải cao có thể dao động từ 2,5°C đến 5,7°C. Khoảng này phản ánh sự hiện diện của không chắc chắn do cả mô hình lẫn kịch bản.
Không chắc chắn khí hậu cũng liên quan đến tác động khu vực. Dự báo lượng mưa, hạn hán, lũ lụt có mức độ tin cậy khác nhau tùy vùng. Điều này buộc các nhà hoạch định chính sách phải sử dụng công cụ phân tích rủi ro dựa trên dải kết quả chứ không phải giá trị duy nhất, nhằm xây dựng chiến lược thích ứng linh hoạt.
Không chắc chắn trong kinh tế và tài chính
Trong kinh tế học, Frank H. Knight (1921) phân biệt giữa rủi ro (risk) – có thể định lượng bằng xác suất, và không chắc chắn (uncertainty) – không thể định lượng hoàn toàn. Đây là nền tảng lý thuyết quan trọng để hiểu hành vi của doanh nghiệp, nhà đầu tư và chính phủ trong bối cảnh biến động. Trong thực tế, thị trường tài chính đầy rẫy không chắc chắn do sự kết hợp của biến động kinh tế vĩ mô, chính sách, xung đột và tâm lý nhà đầu tư.
Để đo lường, IMF xây dựng chỉ số Global Uncertainty Index từ văn bản báo chí, thể hiện mức độ bất định toàn cầu. Ngoài ra, các thước đo biến động như chỉ số VIX (Volatility Index) cũng được sử dụng như thước đo của không chắc chắn thị trường. Sự gia tăng không chắc chắn thường dẫn đến giảm đầu tư, trì hoãn quyết định và biến động giá tài sản. Điều này thể hiện rõ trong các giai đoạn khủng hoảng tài chính toàn cầu (2008), khủng hoảng nợ công châu Âu, và đại dịch COVID-19.
Các mô hình tài chính thường xử lý không chắc chắn bằng cách:
- Mô phỏng Monte Carlo để dự báo phân phối lợi nhuận và rủi ro danh mục
- Mô hình hóa bằng quy trình ngẫu nhiên (Brownian motion, jump diffusion)
- Ứng dụng lý thuyết ra quyết định trong điều kiện bất định (Decision theory)
- Tích hợp phân tích kịch bản và stress test để đánh giá tính chống chịu
Không chắc chắn trong y học và dịch tễ học
Trong nghiên cứu y khoa, không chắc chắn luôn tồn tại từ khâu chẩn đoán đến điều trị. Thử nghiệm lâm sàng báo cáo kết quả kèm khoảng tin cậy (confidence interval – CI) để chỉ rõ phạm vi hiệu quả thực sự của thuốc. Ví dụ, một kết quả cho thấy thuốc làm giảm nguy cơ 25%, nhưng kết quả thực sự có thể dao động từ 10% đến 40%. Việc công bố minh bạch CI giúp nhà lâm sàng và bệnh nhân hiểu rõ mức độ tin cậy của kết quả.
Trong dịch tễ học, không chắc chắn còn liên quan đến dự báo diễn biến dịch bệnh. Khi dự báo số ca mắc COVID-19 hoặc Ebola, các mô hình thường đưa ra dải giá trị chứ không phải con số duy nhất. Điều này phản ánh sự thiếu chắc chắn về tốc độ lây lan, hiệu quả can thiệp và hành vi xã hội. WHO nhấn mạnh rằng truyền thông rõ ràng về không chắc chắn là yếu tố quan trọng để công chúng hiểu và tuân thủ biện pháp phòng dịch.
Phương pháp thường dùng để quản lý không chắc chắn trong y học:
- Phân tích độ nhạy (sensitivity analysis) để kiểm tra kết quả thay đổi thế nào khi giả định thay đổi
- Sử dụng Bayesian inference để cập nhật thông tin khi có dữ liệu mới
- Áp dụng mô hình dự báo nhiều kịch bản nhằm chuẩn bị phương án ứng phó
Quản lý và truyền thông về không chắc chắn
Không chắc chắn cần được quản lý thay vì loại bỏ, vì nó là đặc tính tự nhiên của hệ thống phức tạp. Quản lý không chắc chắn bao gồm việc định lượng, đánh giá mức ảnh hưởng và truyền thông hiệu quả đến người ra quyết định. Trong khoa học kỹ thuật, các công cụ như phân tích Monte Carlo, phân tích kịch bản và phân tích độ nhạy là nền tảng. Trong khoa học xã hội, phương pháp Delphi và khảo sát chuyên gia cũng được áp dụng để giảm không chắc chắn epistemic.
Truyền thông không chắc chắn là thách thức lớn, vì công chúng thường mong đợi câu trả lời dứt khoát. Nghiên cứu cho thấy việc trình bày theo dải giá trị, mức độ tin cậy và thang xác suất giúp cải thiện niềm tin và khả năng chấp nhận chính sách. Ví dụ, trong cảnh báo khí hậu, thay vì nói “nhiệt độ sẽ tăng 3°C”, nên nói “nhiệt độ có khả năng tăng từ 2,5°C đến 3,5°C với độ tin cậy cao”.
Theo ISO/IEC GUM, báo cáo khoa học nên bao gồm: (1) mô tả nguồn không chắc chắn; (2) cách thức định lượng; (3) khoảng tin cậy hoặc mức phủ. Nguyên tắc minh bạch này cũng được NIST khuyến cáo áp dụng rộng rãi trong đo lường và đánh giá chất lượng.
Tài liệu tham khảo
- NIST. Uncertainty in Measurement. https://www.nist.gov/pml/weights-and-measures/uncertainty-measurement
- ISO/IEC Guide 98-3: Uncertainty of Measurement (GUM). https://www.iso.org/standard/45324.html
- Intergovernmental Panel on Climate Change (IPCC). Reports on Climate Uncertainty. https://www.ipcc.ch/
- International Monetary Fund (IMF). Global Uncertainty Index. https://www.imf.org/
- World Health Organization (WHO). Research Transparency in Public Health. https://www.who.int/
Các bài báo, nghiên cứu, công bố khoa học về chủ đề không chắc chắn:
- 1
- 2
- 3
- 4
- 5
- 6
- 10